پیش پردازش متون چاپی فارسی برای جداسازی حروف

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس
  • author
  • adviser
  • Number of pages: First 15 pages
  • publication year 1379
abstract

پردازش مستندات یکی از جذاب ترین زمینه های بازشناسی الگو است و بازشناسی متون، محوری ترین بخش در پردازش مستندات است . یکی از مهمترین مراحل بازشناسی متون چاپی فارسی جداسازی حروف است . ما در این پایان نامه با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی است ، الگوریتم جداسازی مناسبی برای متون چاپی قدیمی ارائه کرده ایم. برای حل مشکل نایکنواختی کرسی خط، روش مناسبی برای تعیین نوار زمینه پیشتهاد کرده ایم و با اصلاح روش برچسب زنی کانتور بالایی و تکمیل قواعد جداسازی، دقت الگوریتم را برای متون قدیمی افزایش داده ایم. نرخ جداسازی درست حروف با استفاده از این الگوریتم برای یک مجموعه آزمایش که از متون قدیمی برگزیده شده است ، بدون هیچ پس پردازشی 97 درصد است . برای جداسازی نقاط چسبیده به بدنه حروف نیز روشی ارائه شده است که نتایج رضایت بخشی داده است .

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

پیش پردازش تصاویر متون فارسی دوربینی برای کاربردهای بازشناسی حروف

در این پایان نامه، روش هایی برای رفع اعوجاجات هندسی درتصاویر متون فارسی دوربینی ارائه می شود. روش های پیشنهادی شامل رفع انحنا، حذف کجی و پرسپکتیو در این تصاویر هستند. اساس کار در این روش ها به این صورت است که پس از مرحله پیش پردازش، ناحیه مربوط به هر خط متن تعیین و با اعمال تبدیل هندسی پرسپکتیو به روی تصویر، اعوجاجات هندسی آن حذف می شود. الگوریتم پیشنهادی اول، انحنا را برای اولین بار در تصاویر ...

15 صفحه اول

الگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات

در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف 97% است. بر اساس نتایج به دست آمده، بررسی دقیقی د...

full text

جداسازی متون چاپی فارسی و لاتین در اسناد دو زبانه با استفاده از پردازش تصویر سند

امروزه حجم زیادی از اسناد کاغذی موجود، توسط جاروب گر ها یا دوربین ها به اسناد تصویری دیجیتالی تبدیل می شوند. ذخیره سازی، بازیابی و مدیریت کارآمد این شیوه های تصویری، در بسیاری از برنامه ها نظیر اتوماسیون اداری و کتابخانه های دیجیتالی اهمیت فراوانی دارند. برای تبدیل اسناد تصویری به اسناد متنی از سیستم های تشخیص اپتیکی حروف، ocr، استفاده می شود. سیستم های ocr تابع زبان متن بوده و با توجه به زبان ...

15 صفحه اول

حروف فارسی و عربی در نخستین کتاب‌های چاپی فارسی و عربی در جهان

هدف: ارتباطات سیاسی و اقتصادی بین خاورمیانه و غرب در عصر رنسانس، سبب چاپ کتاب به الفبای عربی در اروپا شد. این مقاله به تحول حروف چاپی در نخستین کتاب‌های چاپ شده به زبان‌های فارسی و عربی می پردازد.روش/ رویکرد پژوهش: این مقاله با استفاده از مواد کتابخانه‌ای وآرشیوی نوشته شده است.یافته‌ها: پیش از شروع چاپ در اروپا با استفاده از حروف متحرک عربی، ابتدا این کتاب‌ها به‌وسیله قالب‌های چوبی چاپ می‌شد. د...

full text

بازشناسی متون چاپی فارسی

برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023